DID前沿论文推荐 |《中国工业经济》:交错DID及异质性—稳健DID(附代码实现)
最新更新的2023年第1期《中国工业经济》上1篇前沿DID论文:交错DID及异质性—稳健DID
来源:中国工业经济、《网络基础设施建设、信息可得性与企业创新边界》
日前查看到更新的2023年第1期《中国工业经济》上涉及一篇前沿DID论文,里面稳健性检验后拓展分析部分用到了交错DID及异质性—稳健估计量(csdid)
背景介绍:
为进一步推进网络基础设施建设,国务院于 2013 年发布《“宽带中国”战略及实施方案》,并 在 2014 年、2015 年和 2016 年先后认定了三批“宽带中国”试点城市。“宽带中国”战略有力推动了 网络基础设施的整体建设和升级。
本文以“宽带中国”战略的推进作为一项准自然实验,检验了 “宽带中国”战略带来的网络基础设施水平的提升对企业拓展创新边界的影响,为本文的研究结论提供了进一步的支撑证据。
数据
考虑到“宽带中国”战略在 2014 年开始才推出第一批试点,而本文所使用的主要数据为截止至 2013 年的中国工业企业数据,因此,与当前大多数使用“宽带中国”战略作为研究内容的文献 相同,本文在此使用的数据为上市公司数据。依照同样的做法,本文将专利数据与上市公司进行 匹配,并识别计算得到上市公司每年申请的新技术领域专利数量。为保证样本间的可比性,本文 剔除了金融业、保险业、房地产业、教育以及零售批发业等行业的样本,并剔除了 ST、*ST、PT 以及数据缺失的企业样本,样本期为 2009-2017 年。
模型构建
为检验“宽带中国”战略对企业拓展创新边界的影响,本文构建如下交错双重差分模型:
变量介绍:
其中,被解释变量 innov 同样表示衡量企业创新的相关指标,在此为企业新技术领域专利数 量加 1 后的对数值 broadband 为根据“宽带中国”试点政策构造的指示变量,城市 c 在入选 为试点城市的当年及之后年份取值为 1,否则为 0。 参考已有相关研究,X 为企业和城市层面的控 制变量,与正文相同,既包括人均 GDP、产业结构、交通基础设施水平等城市层面的变量,也包 括企业规模、研发投入占比、股权结构、净资产收益率、资产负债率等表征企业特征的变量。 同 时,本文还控制了省份—年份的交互固定效应以及行业—年份的交互固定效应,以控制来自省份 层面和行业层面的影响因素对结果的干扰。同样,αi 为企业固定效应, λt 为年份固定效应。
为随机误差项。
估计结果为:
结果解释为:
附表 5 第(1)列首先报告了双向固定效应模型的估计结果,估计系数在 5%水平上显著为正, 意味着以“宽带中国”表示的网络基础设施建设显著促进了企业新领域专利数量的增加。
考虑到 处理效应异质性可能导致双向固定效应模型的估计产生潜在偏误,本文进一步根据 Callaway and Sant' Anna(2021)的方法计算了“异质性—稳健”估计量,附表 5 第(2)列报告了以“未受处理组” 为控制组、以所有组所有时期为估计的组别—时期处理效应结果,尽管该方法会在计算过程中丢 失大量样本,但其估计结果显示,平均处理效应仍然显著为正。
Stata复刻代码结果为:
完整命令为:
reghdfe patent_new did $control , absorb(id year#province year#sic_da) cluster(id)
(dropped 628 singleton observations)
(MWFE estimator converged in 13 iterations)
HDFE Linear regression Number of obs = 7,603
Absorbing 3 HDFE groups F( 11, 1603) = 1.84
Statistics robust to heteroskedasticity Prob > F = 0.0426
R-squared = 0.5847
Adj R-squared = 0.4157
Within R-sq. = 0.0047
Number of clusters (id) = 1,604 Root MSE = 0.7966
(Std. err. adjusted for 1,604 clusters in id)
------------------------------------------------------------------------------
| Robust
patent_new | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
did | .1298855 .0574112 2.26 0.024 .0172766 .2424945
gdp | -6.63e-07 8.19e-07 -0.81 0.418 -2.27e-06 9.43e-07
road | -.0061418 .0084765 -0.72 0.469 -.0227681 .0104844
highrail | .0020894 .0083714 0.25 0.803 -.0143306 .0185094
airport | -.1405601 .1627545 -0.86 0.388 -.459794 .1786739
rdspend | .004758 .0039467 1.21 0.228 -.0029833 .0124992
sharehold | .0666924 .3453499 0.19 0.847 -.6106923 .7440772
roa | -.0318536 .0285641 -1.12 0.265 -.0878805 .0241733
leverage | .0758731 .1598949 0.47 0.635 -.2377519 .3894981
size | .0830696 .0312542 2.66 0.008 .0217663 .144373
lnage | -.1029675 .0570214 -1.81 0.071 -.2148119 .0088769
_cons | .1044914 .6220923 0.17 0.867 -1.115708 1.324691
------------------------------------------------------------------------------
Absorbed degrees of freedom:
---------------------------------------------------------+
Absorbed FE | Categories - Redundant = Num. Coefs |
-----------------+---------------------------------------|
id | 1604 1604 0 *|
year#province | 234 0 234 |
year#sic_da | 360 9 351 |
---------------------------------------------------------+
* = FE nested within cluster; treated as redundant for DoF computation
. csdid patent_new $control , ivar(id) time(year) gvar(policy_year) method(dripw) agg(simple)
No never treated observations found. Using Not yet treated data
Panel is not balanced
Will use observations with Pair balanced (observed at t0 and t1)
......xx......xxxxxxxxxx
Difference-in-difference with Multiple Time Periods
Number of obs = 2,962
Outcome model : least squares
Treatment model: inverse probability
------------------------------------------------------------------------------
| Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
ATT | .3079178 .1794665 1.72 0.086 -.0438302 .6596657
------------------------------------------------------------------------------
Control: Not yet Treated
See Callaway and Sant'Anna (2021) for details
.